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摘 要 : 耕地 保护 关系 到 国家 粮食 安全 和 和 经济 社会 可 持续 发 展 ,对 生态 环境 保护 具有 重要 作用 , 快 
速 精准 的 获取 耕地 土壤 盐分 含量 及 空间 分 布 信息 是 耕地 保护 的 必然 要 求 。 以 宁夏 平 罗 县 为 研究 
区 ,利用 Landsat 9 OLIL 和 Sentinel-1 遥 感 影像 ,提取 光谱 指数 和 雷达 极 化 组 合 指数 ,基于 变量 投影 
重要 性 法 与 灰 度 关 联 法 筛选 特征 变量 ,然后 运用 反 向 传播 神经 网 络 、 支 持 向 量 机 和 随机 森林 3 种 机 


器 学 习 算法 构建 模型 ,并 用 最 佳 模型 反 演 耕地 土壤 含 盐 量 空间 分 布 情况 。 结 果 表 明 :(1) 利用 变量 


投影 重要 性 法 筛选 变量 建立 的 模型 验证 集 决 定 系 数 ( 尼 ) 大 于 灰 度 关联 法 筛选 变量 建立 的 模型 。(2) 
利用 随机 森林 算法 ,组合 光 谱 指 数 和 雷达 极 化 组 合 指数 协同 反 演 模型 效果 最 佳 , 建 模 集 尼 为 0.791 , 均 
方 根 误 差 (RMSE ) 为 1.016 , 尼 较 单一 数据 源 模型 分 别提 高 0.065 和 0.085,RMSE 分 别 降 低 0.147 和 
0.189 ; 验证 集 尼 为 0.780,RMSE 为 1.132 , 尼 较 单一 数据 源 模型 分 别提 高 0.091 和 0.237,RMSE 分 别 
降低 0.175 和 0.377。(3) 平 罗 县 耕地 轻 度 盐 渍 化 和 中 度 盐 渍 化 土壤 分 布 范围 广 ,点 比 分别 为 23.77% 
和 33.54% ,重度 盐 渍 化 达 15.37%。 研 究 结果 发 现 ,组 合 多 源 遥 感 数据 建 模 能 够 有 效 提高 土壤 含 盐 


量 反 演 精度 ,可 为 干旱 区 耕地 土壤 含 盐 量 的 反 演 和 当地 农业 可 持续 发 展 提供 有 效 的 技术 参考 。 
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自然 或 人 为 引起 的 土壤 盐 渍 化 是 一 种 重大 的 
环境 灾害 ,广泛 发 生 在 内 陆 干旱 、 半 干旱 地 区 ,严重 
影响 农业 生产 和 区 域 可 持续 发 展 。 据 估计 ,到 2050 
年 全 球 约 50% 的 耕地 会 面临 盐 碱 化 汪 ,将 成 为 世界 
性 的 生态 问题 ”。 因 此 ,运用 科学 手段 精准 反 演 和 
监测 耕地 土壤 盐 溃 化 动态 ,及 时 治理 和 缓解 耕地 土 
二 盐 渍 化 ,对 区 域 粮食 生产 和 农业 可 持续 发 展 具有 

卫星 遥感 手段 能 快速 .宏观 地 获取 土壤 光谱 特 
征 ,通过 构建 遥感 监测 模型 ,可 以 实现 大 范围 土壤 
盐 渍 化 监测 和 评估 ”。 光 学 遥感 可 以 提供 多 波段 的 
光谱 信息 ,对 土壤 盐分 具有 较 强 敏感 性 ,研究 者 通 
过 构建 光谱 指数 实现 土壤 盐分 的 反 演 。 陈 红 艳 等 " 
基于 Landsat 8 OLI, 引入 第 7 波段 (2100~2300 nm) 
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对 植被 指数 进行 改进 ,模型 反 演 精度 大 幅 提 升 。 
Wang 等 5 等 用 Sentinel-2 红 边 波段 代替 原来 红 光 波 
段 构建 光谱 指数 ,提高 了 光谱 信息 对 土壤 盐分 的 敏 
感性 。 然 而 单一 光学 数据 易 受 成 像 时 间 .云雨 等 天 
气 影响 ,依赖 光谱 特征 提取 盐 渍 化 信息 具有 局 限 
性 “。 微 波 遥感 具有 全 天 候 工作 能 力 ,不 易 受 气象 
条 件 和 日 照 水 平 影响 。 同 时 ,由 于 试验 区 有 植被 
覆盖 ,光谱 反射 率 受 影响 ,而 微波 遥感 能 穿 透 植 
被 ,具有 探测 地 表 下 目标 的 能 力 "。 马 驰 等 基 
于 Sentinel-1 雷达 影像 ,分 析 垂 直 极 化 模式 (内 ) 和 
交叉 极 化 模式 (Vi) 组 合 的 后 向 散射 系数 与 土壤 盐分 
之 间 的 关系 ,确定 (K+VEAWR-Vi) 极 化 组 合 的 后 向 
散射 系数 可 以 较 好 分 离 不 同 含 盐 量 的 土壤 。 张 智 
42% ° Fill FA Sentinel-1 雷达 数据 探究 了 内 蒙古 河套 
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灌区 不 同 深度 土壤 含 盐 量 。 尽 管 上 述 人 研究 已 经 取 
得 较 好 的 结果 ,但 多 基于 单一 遥感 数据 ,而 组 合 光 
学 和 微波 遥感 反 演 土壤 含 盐 量 相关 研究 较 少 。 肖 
森 天 等 "组 合 光学 影像 和 雷达 后 向 散射 特征 ,验证 
了 光学 与 雷达 数据 组 合 在 土壤 盐 渍 化 监测 方面 的 
可 行 性 。 然 而 该 研究 仅 利用 随机 森林 分 类 算法 对 
土壤 盐 涡 化 进行 了 等 级 分 类 ,并 没有 反 演 出 土壤 不 
同 区 域 具体 的 盐分 值 。 而 本 文 利用 随机 森林 的 回归 
算法 ,能 够 反 演 得 到 研究 区 耕地 像 元 尺度 土壤 含 盐 
量 , 在 一 定 程度 上 可 以 保留 更 多 的 盐分 信息 。 

土壤 盐 渍 化 产生 原因 和 土壤 盐分 组 成 复杂 ,在 
特征 变量 的 选择 上 ,不 同 区 域 的 研究 结果 存在 差 
异 "'""。 因 此 ,需要 采用 不 同方 法 来 第 选 特征 变量 。 
常用 的 方法 有 相关 系数 法 (PCC) .逐步 回归 (SR) JK 
度 关联 法 (GC) 和 变量 投影 重要 性 法 (VIP) 等 。 王 海 
1R A GC. SR 和 VIP 3 种 方法 筛选 变量 构建 模 
型 ,发 现 不 同 筛选 方法 下 模型 精度 不 同 。Wang 等 3 
基于 PCC、VIP、GC、 随 机 和 森林 (RF) 筛 选 变量 ,并 利 
用 偏 最 小 二 乘 回 归 (PLSR ) 建 立 模型 ,结果 显示 GC- 
PLSR 模型 决定 系数 ( 尼 ) 高 于 VIP-PLSR 模型。 不 同 
建 模 方 法 反 演 效果 不 同 , 刘 恩 等 ”等 采用 多 元 线性 
回归 和 反 向 传播 神经 网 络 (BPNN ) 反 演 小 开 河 引 黄 
灌区 土壤 盐 渍 化 ,发 现 BPNN 的 精度 优 于 传统 的 多 
元 线性 回归 。 而 陈 红 艳 等 中 以 Landsat 8 0LI 建 立 的 
土壤 含 盐 量 反 演 模型 中 ,支持 向 量 机 (SVM) 精 度 优 


(a) 土地 利用 类 型 分 布 
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于 BPNN。 此 外 ,RF 具有 可 处 理 非 线 性 数据 、 抗 拟 
合 能 力 强 的 特点 ,在 土壤 盐分 及 主要 离子 定量 佑 测 
方面 已 显示 出 较 好 效果 。 变 量 筛 选 方法 结合 机 
器 学 习 算 法 进行 土壤 盐分 反 演 是 近 几 年 的 研究 热 
点 ,而 比较 不 同 变量 筛选 方法 IF ZA A AS TA OL a 
习 算 法 反 演 土壤 含 盐 量 相关 研究 较 少 。 

本 文 以 宁夏 平 罗 县 为 研究 区 ,基于 光学 和 微波 
遥感 影像 ,提取 光谱 指数 和 雷达 极 化 组 合 指数 ,使 
用 VIP 和 GC 筛选 特征 变量 ,然后 利用 BPNN、SVM 
和 REF 机 器 学 习 算 法 构建 耕地 土壤 含 盐 量 反 演 模 
型 ,评定 不 同 变量 输入 和 不 同 建 模 方法 下 土壤 含 盐 
量 反 演 精度 ,并 反 演 研究 区 耕地 土壤 盐分 分 布 ,为 
银川 平原 耕地 土壤 盐 渍 化 的 潜在 识别 和 防治 提供 
理论 依据 和 技术 支持 。 


1 数据 与 方法 


1.1 研究 区 概况 

研究 区 位 于 宁夏 石嘴山 市 平 罗 县 (38°26'60”~ 
39°14'09"N , 105°57'40"~106°52'52"E ) ,地 处 贺 兰 
东 划 洪 积 扇 和 黄河 冲积 之 间 .宁夏 平原 北部 ,是 重 
要 的 灌溉 农业 区 。 年 平均 降水 量 150~203 mm, 4F 28 
发 量 超过 1825 mm, AMELIA BY 10:1。 主 要 土地 利 
用 类 型 为 耕地 、 林 地 .草地 和 盐 碱 荒地 ,耕地 总 面积 
约 9.5Sx10'*hm2 ,主要 分 为 水 田 和 旱地 。 试 验 区 (图 1) 
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图 例 。 采 样 点 口试 验 区 CR 
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土地 利用 类 型 四 水体 BE 林地 有 草地 加 未 利用 地 可 有 城乡、 工矿 、 居 民用 地 


图 1 研究 区 土地 利用 类 型 及 试验 区 分 布 
Fig. 1 Land use types of the study area and distribution of the test areas 


选择 平 罗 县 耕地 区 域 进行 布设 ,分 别 位 于 平 罗 县 山 
前 洪 积 扇 区 . 西 大 滩 碟 形 洼地 、 冲 积 平原 区 RRE 
地 和 河滩 区 五 大 地 貌 单元 。 同 时 ,采样 时 间 人 处 于 春 
耕 农忙 之 前 ,人 为 扰动 较 少 。 

1.2 数据 来 源 与 预 处 理 

1.2.1 土壤 样本 采集 与 盐分 测定 样本 采集 于 2022 
年 3 月 20 日 一 4 月 8 日 ,采样 时 利用 五 点 法 采集 0~ 
20 cm 土壤 ,编号 装 入 采样 袋 带 回 实验 室 。 土 样 经 
过 自然 风干 .研磨 ,并 用 2 mm 孔径 第 过 滤 后 ,以 水 土 
5:1 配置 提取 液 ' 引 ,运用 电导 率 法 "计算 样本 的 含 盐 
量 ,每 个 样本 重复 3 次 , 取 平 均值 作为 该 点 的 盐 
分 值 。 


含 盐 量 大 小 划分 样本 盐 渍 化 程度 。 样 本 
总 体 变异 系数 为 79.154%( 表 1) , 呈 中 等 强度 变异 ， 
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表明 样本 分 布 离散 ,具有 普 适 性 。 将 样本 按 含 盐 量 
大 小 进行 排序 ,每 隔 2 个 样本 取出 1 个 用 于 模型 验 
证 ,剩余 样本 用 于 建 模 , 共 选 取 70 个 样本 作为 建 模 
数据 ,34 个 样本 作为 验证 数据 。 建 模 集 与 验证 集 样 
本 分 布 趋势 与 总 样本 分 布 趋势 一 致 \ 图 2) ,说 明 样 
本 划分 合理 ,可 用 于 模型 构建 和 验证 。 
1.2.2 逐 感 影像 数据 获取 与 处 理 Landsat 9 OL 
感 影像 来 源 于 美国 地 质 勘探 局 (https://earthexplorer. 
usgs.gov) ,行列 号 为 129/33 ,成像 时 间 为 2022 年 4 月 
5 日 , 云 量 为 4.7%。 在 ENVI 5.3 中 对 影像 进行 辐射 
校正 .裁剪 等 预 处 理 ,计算 盐分 指数 和 植被 指数 ,如 
表 2 所 示 。 

Sentinel-1 数据 来 源 于 欧洲 航空 航天 局 数据 网 
站 (https://scihub.copernicus.eu ) ,成 像 时 间 为 2022 年 


表 1 土壤 样本 描述 性 统计 


Tab.1 Descriptive statistics of soil samples 


含 盐 量 /g* kg 


样本 等 级 ( 含 盐 量 /g'kg-) 样本 数量 /个 Pr 最 大 信 BNE 变异 系数 /% 
非 盐 涡 化 (<1) 15 0.775 0.999 0.510 16.712 
轻 度 盐 涡 化 (1~2) 27 1.326 1.963 1.008 19.913 
中 度 盐 涡 化 (2~4) 32 2.853 3.795 2.066 18.081 
重度 盐 涡 化 (4~6) 15 4.966 5.909 4.060 12.385 
盐 土 (>6) 15 8.208 14.231 6.145 25.133 
总 样本 104 3.251 14.231 0.510 79.154 
均值 : 3.231 均值 : 3.257 均值 : 3.180 
15 标准 差 : 2.577 标准 差 : 2.635 标准 差 : 2.497 
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注 :总 样本 104 个 , 建 模 集 70 个 ,验证 集 34 个 ; 箱 线 图 和 正 态 分 布 图 表示 样本 分 布 趋势 。 


图 2 不 同 数据 集 土壤 样本 分 布 


Fig. 2 Distributions of soil samples in different datasets 
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R2 光谱 指数 计算 公式 


Tab. 2 Calculation formulas of spectral indices 


光谱 指数 公式 
盐分 指数 (SI) Blue x Red 
盐分 指数 1(SI1)™ Green X Red 
盐 渍 化 指数 1(S1)™ Blue/Red 
盐 渍 化 指数 2(S2)P (Blue—Red)/(Blue+Red) 
盐 渍 化 指数 $(S5 )! BluexRed/Green 
扩展 差 值 植被 指数 (EDVI)m NIR+SWIR1-Red 
扩展 比值 植被 指数 (ERVID)" (NIR+SWIR1)/Green 
大 气 阻 抗 植被 指数 (NIR-2Red+Blue)/(NIR+2Red-Blue) 
(ARVI)™ 
冠 层 盐 度 响 应 植被 指数 INIRxRed)-(CreenxBlue) 
(CRSD™ J (NIR x Red) + (Green x Blue) 
扩展 增强 型 植被 指数 2.5(NIR + SWIR1 - Red) 
(EEVI)"! (NIR + SWIR1 + 6Red — 7.5Blue + 1) 


注 :Blue Green „Red NIR.SWIR1 分 别 为 蓝 波段 (b2) 、 绿 波段 (b3)、 
红 波 段 (b4) . 近 红 外 波段 (b5) ,短波 红外 1(b6) 的 光谱 反射 率 (% )。 


4 月 1 日 ,数据 级 别 为 Level 1, 包 括 垂 直 极 化 模式 和 
交叉 极 化 模式 。 利 用 SNAP 软 件 对 数据 进行 热 噪声 
去 除 .轨道 文件 校正 .辐射 定 标 等 处 理 。 已 有 研究 
指出 ,对 于 单 极 化 雷达 数据 ,如 提取 的 土壤 信息 
量 相 对 较 少 ,研究 结果 会 受到 一 定 影响 。 因 此 ,将 
雷达 影像 的 极 化 方式 进行 组 合 , 以 提高 土壤 含 盐 量 
反 演 精度 ”2 。 本 文 所 用 指数 如 表 3 所 示 。 

1.2.3 土地 利用 数据 获取 及 处 理 十 地 利用 数据 从 
中 国 科学 院 资 源 环境 科学 与 数据 中 心 (http:/www. 


Aa A A a i i E a 


表 3 雷达 极 化 组 合 指数 计算 公式 
Tab.3 Calculation formulas of radar polarization 


combination indices 


雷达 极 化 组 合 指数 ”参考 文献 | 雷达 极 化 组 合 指数 ”参考 文献 
Vy [9] W-Vit [9] 
Vu [9] WV [9] 
W-Va [8] VeVi [9] 
Vth [8] Vi-Vy [9] 
Vp [9] WR [9] 
注 :从 为 垂直 极 化 的 雷达 后 向 散射 系数 ;也 为 交叉 极 化 的 雷达 后 向 


resdc.cn) 获 取 , 根 据 分 类 标准 将 研究 区 土地 利用 分 
为 6 类 (图 1): 耕 地 林地 、 草 地、 水域. 未 利用 地 以 及 
城乡 .工矿 居民 用 地 ,提取 耕地 作为 研究 对 象 。 
1.3 研究 方法 

首先 进行 数据 获取 和 处 理 , 包 括 光 谱 指 数 、 雷 
达 极 化 组 合 指数 的 计算 ,土壤 含 盐 量 的 测定 ;然后 
采用 变量 投影 重要 性 法 和 灰 度 关 联 法 进行 土壤 含 
盐 量 特征 变量 筛选 ;最 后 利用 筛选 的 变量 ,采用 3 种 
不 同 机 器 学 习 算 法 分 别 构建 光谱 指数 模型 .雷达 极 
化 组 合 指数 模型 .光谱 指数 和 雷达 极 化 组 合 指数 协 
同 模型 ,并 进行 精度 验证 ,选择 最 优 模型 进行 研究 
区 耕地 土壤 含 盐 量 反 演 。 有 具体 研究 思路 如 图 3 
所 示 。 
13.1 土壤 含 盐 量 特 征 变量 第 选 采用 变量 投影 8 
要 性 法 和 灰 度 关联 法 进行 特征 变量 筛选 。 变 量 投 


Landsat 9 OLI 光学 数据 | >] 数据 预 处 理 | 一 一 >| 。 光谱 指数 计算 | 


Sentinel-1 雷 达 数 据 


一 一 >| 数据 预 处 


土壤 采样 数据 处 理 


sa | 一 雷达 极 化 组 合 指数 计算 | 
一 > 电导 率 、 盐 分 测定 | >| ”描述 性 统计 


光谱 指数 模型 


雷达 极 化 组 合 指数 模型 


土壤 含 盐 量 反 演 等 级 分 布 图 


光谱 指数 和 雷达 极 化 组 合 指数 协同 模型 


注 :VIP.GC 分 别 为 变量 投影 重要 性 法 和 灰 度 关联 法 ;BPNN .SVM .RF 分 别 为 反 向 传播 神经 网 络 .支持 向 量 机 和 随机 森林 。 
图 3 研究 路 线 


Fig. 3 Research route 


影 重要 性 法 是 一 种 基于 偏 最 小 二 乘 回归 的 变量 得 
选 方法 。 对 于 给 定 的 自 变量 ,变量 投影 重要 性 不 
仅 表 示 自 变量 对 因 变 量 的 影响 ,还 考虑 了 其 他 自 变 
量 对 因 变 量 的 间接 影响 。 计 算 公式 为 : 


F 
px $ SSY x We 
VIP, 


/31 
SSY xF (1) 


total 


AP: VIP, 为 变量 的 重要 性 ;p 为 自 变量 个 数 ;为 
主 成 分 总 数 ;f 为 主 成 分 ; SSY, 为 1 主 成 分 解释 的 方 
HPA SSY a 为 因 变量 平方 和 ; Wy 为 变量 在 
f 主 成 分 中 的 重要 性 。 VIP, 越 大 , 自 变 量 对 因 变 量 
的 解释 力 越 强 。 当 自 变量 的 VIP, 大 于 1 时 ,独立 变 
量 被 判断 为 重要 的 自 变量 *!。 

灰色 关联 度 分 析 是 一 种 多 因素 统计 方法 ,其 目 
的 是 通过 一 定 的 方法 原理 确定 系统 中 各 因素 的 主 
要 关系 ,用 灰色 关联 度 刻 画 因 素 间 关系 的 强 弱 和 次 
FP , 找 出 影响 最 大 的 因素 ”。 计 算 公 式 为 : 

GCD = LS yinx] (2) 

式 中 ;GCD 为 灰色 关联 度 ;i 为 变量 ;n 为 变量 个 数 ;y 
为 关联 系数 ; x) 为 参考 序列 ; x 为 比较 序列 ， 
其 中 : 

ylxo(t)x;(1)]= 


min min|xo() =x% O +p max max|xo() —x,(0)| (3) 


i 


|xo(t)—x,0| + pmax max| x(t) - x,(0| 

式 中 : min min|xo(t) — x;(t)| 和 max max|xo() — x,()| 为 
极 差 最 小 值 和 最 大 值 ;p 为 介 于 [0, 1] 之 间 的 分 辨 系 
数 ,本 文 设 为 0.5。 
1.3.2 机 器 学 习 模 型 

(1) 反 疝 传播 神经 网 络 (BPNN) 

BPNN 基于 反 向 传播 误差 方式 对 数据 集 进行 训 
练 , 达 到 误差 最 小 化 的 目的 ”。 该 模型 是 对 非 线 
性 映射 的 全 局 逼近 ,拥有 较 强 的 自 适 应 和 自学 习 能 
力 “。 本 文 模型 训练 目标 最 小 误差 设置 为 0.00001， 
和 迭 代 次 数 设置 为 1000 次 ,学 习 率 设置 为 0.01。 

(2) 支持 向 量 机 (SVM) 

SVM 基于 结构 风险 最 小 原理 ,依靠 有 限 的 样 
本 来 检索 全 局 最 优 解 ,对 未 知 点 有 较 好 的 泛 化 效 
RS AS 303% AA RBF (Radial basis function) X SVM 
FY PR BR HY, RET IF Ce) AK PHBL (g) HH EAS UIA 
得 到 ,分别 为 13 和 5。 
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(3) 随机 和 森林 (RF) 

REF 是 基于 多 棵 回归 树 的 集成 学 习 方 法 ,通过 结 
合 多 个 决策 树 ,并 平均 其 结果 使 得 决策 树 泛 化 误差 
收敛 从 而 产生 更 好 的 预测 结果 六 。RF 善 于 处 理 变 
量 间 的 非 线性 关系 ,预测 性 能 受 回 归 树 棵 数 .最 大 
深度 .最 小 叶子 数 等 参数 影响 所 。 本 文 回归 树 棵 树 
为 200, 最 小 叶子 数 为 4。 
1.3.3 模型 评价 为 定量 比较 不 同 算法 反 演 土壤 含 
盐 量 的 精度 ,本 文选 择 2 个 常用 指标 决定 系数 (R*) 
和 均 方 根 误差 (RMSE) 来 进行 量化 。R 越 大 ,RMSE 
越 小 ,说 明 模 型 拟 合 效果 越 好 。 


2 GRAD 


21 土壤 含 盐 量 的 特征 变量 筛选 

利用 式 (1) 式 (2) 计 算 指数 的 变量 投影 重要 性 
(图 4) 和 灰色 关联 度 (图 5) ,筛选 出 特征 变量 参与 建 
模 。 结 果 表 明 ,光谱 指数 S1、S2、ARVI、CRSI、EEVI 
(图 4a) 和 雷达 极 化 组 合 指数 Vv Va s Vut Vas VVR, 
也 -内 ( 图 4b) 重 要 性 大 于 1 ,说 明 这 些 变 量 是 指示 土 
壤 盐 分 的 重要 变量 ,可 作为 特征 变量 参与 建 模 。 

由 图 $a 可 知 ,光谱 指数 与 土壤 含 盐 量 灰色 关联 
度 均 大 于 0.73 ,其 中 ARVI 灰 色 关 联 度 最 高 ,达到 了 
0.784;S2 灰色 关联 度 最 低 ,为 0.738。 和 雷达 极 化 组 合 
指数 与 土壤 含 盐 量 灰色 关联 度 (图 5b) 介 于 0.71~ 
0.75, 最 高 为 V+W 的 0.739。 为 实现 特征 变量 第 选 ， 
本 文 设 光谱 指数 和 雷达 极 化 组 合 指数 灰色 关联 度 
国 值 为 0.720 ,统计 基于 灰 度 关联 分 析 的 土壤 含 盐 量 
敏感 指数 情况 。 结 果 发 现 , 利 用 灰 度 关联 法 筛选 的 
光谱 特征 变量 较 雷达 特征 变量 多 ,其 中 ,10 个 光谱 
指数 都 为 特征 变量 ,雷达 极 化 组 合 指数 中 筛 选 出 
W Va, V- Va Ww Va FD Ve- Vadit 5 MEERA 
建 模 。 
2.2 模型 构建 与 验证 

光谱 指数 模型 中 ,以 土壤 含 盐 量 作为 因 变 量 ， 
选取 VIP 筛选 的 S1.S2 、ARVI、.CRSI EEVI 作 为 自 变 
量 构建 VIP-BPNN , VIP-SVM VIP-RF 模型 ;选取 GC 
筛选 的 S1.S2.S5 SI SII ARVI, EDVIERVI、CRSI、 
EEVI 作 为 自 变 量 构建 GCC-BPNN , GC-SVM ,GC-RF 
模型 。 
雷达 极 化 组 合 指数 模型 中 ,选取 VIP 筛 选 的 从、 
Va Vvt Va, WV Va-Vw EA A REE VIP-BPNN , 
VIP-SVM , VIP-RF 模型 ;选取 GC fifi HE AY VW. Van 
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1 8 的 光谱 指数 


1.6 上 


变量 投影 重要 性 
© 


TOS OK’ 


指数 


注 : 横 轴 光 谱 指数 和 雷达 极 化 组 合 指数 含义 同 表 2、 表 3 所 示 。 
图 4 特征 变量 与 土壤 含 盐 量 的 投影 重要 性 
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Fig. 4 Projection importance between soil salt content and characteristic variables 
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图 5 特征 变量 与 土壤 含 盐 量 的 灰色 关联 度 


Fig. 5 Grey relativity between soil salt content and characteristic variables 


Vy- Va, V+ Va. W-Va PEAY H ZE et #4) gt GC-BPNN GC- 
SVM .GC-RF 模 型 。 

结果 发 现 ( 表 4) ,光谱 指数 模型 中 ,利用 VIP 筛 
选 变量 构建 的 3 个 模型 验证 集 尼 均 大 于 0.46,RMSE 
均 小 于 1.93 ,其 中 VIP-RF 模 型 精度 最 高 , 建 模 集 和 
验证 集 尼 分 别 为 0.726 和 0.689,RMSE 分别 为 1.163 
和 1.307, 模 型 具有 和 较 强 的 稳定 性 。 利 用 GC 筛选 变 
量 构建 的 3 个 模型 验证 集 尼 整体 较 低 ,其 中 GC- 
SVM 模型 验证 效果 较 好 ,GC-BPNN 模型 次 之 ,GC- 
RF 模型 验证 集 误差 最 大 。 雷 达 极 化 组 合 指数 模型 
中 ( 表 4) ,VD 筛选 变量 建立 的 模型 建 模 集 和 验证 集 
尼 呈 现 VIP-RF>VIP-SVM>VIP-BPNN 的 规律 ;GC fifi 
选 变量 建立 的 模型 建 模 集 和 验证 集 尼 呈现 同样 的 
规律 ,表明 随机 森林 机 器 学 习 算 法 在 雷达 极 化 组 合 
指数 模型 中 具有 较 好 的 反 演 能 力 。 比 较 光 谱 指 数 


模型 和 雷达 极 化 组 合 指数 模型 发 现 ,光谱 指数 模型 
精度 普遍 高 于 雷达 极 化 组 合 指数 模型 ,这 可 能 与 本 
文 盐分 采样 为 0~20 cm 表层 土壤 有 关 ,雷达 数据 更 
适合 于 探测 地 表 下 目标 , 而 光学 数据 具有 丰富 的 地 
表 反 射 率 信 息 。 

对 比 2 种 变量 筛选 方法 建立 的 模型 精度 ( 表 4) 
发 现 ,光谱 指数 模型 中 ,验证 集 精度 VIP-RF>GC- 
RF, VIP-BPNN>GC-BPNN, VIP-SVM>GC-SVM. & 
达 极 化 组 合 指数 模型 中 , 除 VIP-BPNN<GC-BPNN 模 
型 外 ,其 他 2 种 机 器 学 习 模 型 也 呈现 出 基于 VDP 方 
法 筛选 变量 构建 模型 精度 大 于 基于 GC 筛选 变量 构 
建 模型 精度 的 规律 ,表明 VIP 方法 筛选 的 变量 较 优 ， 
更 适 于 研究 区 土壤 含 盐 量 反 演 。 因 此 ,为 验证 多 源 
数据 对 土壤 含 盐 量 反 演 精度 的 影响 ,将 经 过 VIP 方 
法 筛选 得 到 的 光谱 指数 S1.S2 ARVI.CRSI,EEVI fil 
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表 4 基于 单一 遥感 数据 的 机 器 学 习 模 型 


Tab. 4 Machine learning models based on single remote sensing data 


a eh | 建 模 集 验证 集 
R RMSE R RMSE 

光谱 指数 VIP-BPNN 0.325 1.828 0.464 1.926 
VIP-SVM 0.552 1.487 0.476 1.840 

VIP-RF 0.726 1.163 0.689 1.307 

GC-BPNN 0.328 1.822 0.433 1.979 

GC-SVM 0.488 1.591 0.461 1.904 

GC-RF 0.649 1.317 0.327 2.158 

雷达 极 化 组 合 指数 VIP-BPNN 0.228 1.954 0.291 2.214 
VIP-SVM 0.482 1.475 0.524 1.814 

VIP-RF 0.706 1.205 0.543 1.509 

GC-BPNN 0.220 1.964 0.346 2.127 

GC-SVM 0.509 1.440 0.356 1.910 

GC-RF 0.518 1.543 0.413 2.015 


注 :VIP-BPNN 为 基于 变量 投影 重要 性 法 筛选 变量 建立 的 反 向 传播 神经 网 络 模型 ;VIP-SVM 为 基于 变量 投影 重要 性 法 筛选 变量 建立 的 支持 向 


量 机 模型 ;VIP-RF 为 基于 变量 投影 重要 性 法 筛选 变量 建立 的 随机 森林 模型 ;GC-BPNN 为 基于 灰 度 关联 法 筛选 变量 建立 的 反 向 传播 神经 网 络 
模型 ;GC-SVM 为 基于 灰 度 关联 法 筛选 变量 建立 的 支持 向 量 机 模型 ;GC-RF 为 基于 灰 度 关联 法 筛选 变量 建立 的 随机 森林 模型 ; 尼 为 决定 系数 ; 


RMSE 为 均 方 根 误差 。 下 同 。 


TAAL AB XV Van Wt Va, Wt Vit Va- V F fa] 
作为 自 变 量 参与 建 模 , 结 果 如 表 5。 

组 合 光 谱 指 数 和 雷达 极 化 组 合 指数 模型 反 演 
精度 较 单 一 光谱 指数 和 雷达 极 化 组 合 指 数 模型 大 
幅 提高 。 其 中 ,VIP-BPNN 模型 验证 集 尼 分 别提 高 
0.124 和 0.297,RMSE 分 别 降低 0.237 和 0.525。VIP- 
SVM 和 VIP-RF 模型 建 模 集 和 验证 集 尼 均 大 于 0.6， 
RMSE 均 小 于 1.6, 模 型 准确 度 和 学 习性 能 更 强 。 其 
中 ,VIP-RF 建 模 集 尼 较 单一 光谱 指数 和 雷达 极 化 组 
合 指数 模型 分 别提 高 0.065 和 0.085,R? 达 到 了 0.791, 
RMSE 分 别 降 低 0.147 和 0.189; 验证 集 尼 分 别提 高 
0.091 和 0.237 , RKF] T 0.780, RMSE 分 别 降 低 0.175 
和 0.377 ,表明 光谱 指数 和 雷达 极 化 组 合 指数 协同 反 
演 模 型 效果 优 于 单一 数据 源 模型 ,说 明 多 源 遥 感 数 
据 参 与 建 模 能 够 有 效 提 高 土壤 含 盐 量 预测 精度 。 

图 6 为 基于 VIP-RF 构 建 的 光谱 指数 模型 ,雷达 


极 化 组 合 指数 模型 以 及 协同 模型 验证 集 的 实测 值 与 
预测 值 的 散 点 图 。 结 果 表 明 ,组 合 光 谱 指 数 和 雷达 
极 化 组 合 指 数 共 同 建立 的 VIP-RF 模 型 拟 合 效 果 最 
好 , 故 选 择 此 模型 对 研究 区 耕地 土壤 含 盐 量 进行 反 演 。 
2.3 模型 应 用 

选择 精度 最 佳 的 光谱 指数 和 雷达 极 化 组 合 指 
数 VIP-RF 协 同 反 演 模 型 对 平 罗 县 耕地 进行 土壤 盐 
分 反 演 ,得 到 平 罗 县 耕地 土壤 盐分 反 演 等 级 图 (图 
7) ,利用 ArcGIS 统计 不 同 盐 渍 化 等 级 土壤 面积 ( 表 
6)。 由 结果 可 知 , 平 罗 县 耕地 盐 渍 化 情况 较为 严 
重 , 盐 渍 化 土壤 占 比 达到 了 耕地 总 面积 的 86.819% , 
中 度 盐 渍 化 高 达 33.54% ,重度 盐 渍 化 和 盐 土 主要 分 
布 在 中 西部 和 东部 引 黄 灌溉 区 。 盐 渍 化 反 演 结 
与 实地 采样 情况 较为 一 臻 ,表明 组 合 多 源 遥 感 数据 
构建 反 演 模型 在 研究 区 耕地 土壤 盐分 反 演 中 具有 
可 行 性 。 


5 基于 多 源 遥 感 数据 的 机 器 学 习 模 型 


Tab.5 Machine learning models based on multi-source remote sensing data 


= 模型 类 别 建 模 集 i 验证 集 
R RMSE R RMSE 
光谱 指数 和 雷达 极 化 组 合 指数 VIP-BPNN 0.694 1.230 0.588 1.689 
VIP-SVM 0.787 1.027 0.643 1.572 
VIP-RF 0.791 1.016 0.780 1.132 
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(a) 光谱 指数 VIP-RF 模 型 
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(b) 雷达 极 化 组 合 指数 VIP-RF 模 型 


12345678 9101112 
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(c) 光谱 指数 和 雷达 极 化 
组 合 指数 协同 VIP-RF 模 型 


y=0.422x+2.023 
R°=0.543 
RMSE=1.509 
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注 : 尼 为 决定 系数 ;RMSE 为 均 方 根 误差 。 
图 6 不 同 数据 源 变 量 的 VIP-RF 模 型 
Fig. 6 VIP-RF models of different data source variables 


6 耕地 土壤 含 盐 量 反 演 等 级 统计 


Tab. 6 Grade statistics of soil salinity inversion in cultivated land 


盐 渍 化 程度 非 盐 渍 化 轻 度 盐 渍 化 中 度 盐 渍 化 重度 盐 渍 化 盐 土 
像 元 数 /个 138897 250353 353408 161882 148863 
面积 /km 124.95 225.18 317.73 145.60 133.86 
占 比 % 13.19 23.77 33.54 15.37 14.13 


”图 例 
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图 7 耕地 土壤 含 盐 量 反 演 等 级 分 布 


Fig.7 Grade distribution of soil salinity inversion 


in cultivated land 


3 it it 


组 合 多 源 遥 感 数据 反 演 土 壤 含 盐 量 已 成 为 近 
年 来 研究 热点 ,但 如 何 高 效 组 合 不 同 数据 源 ,减少 
影像 数据 处 理 过 程 中 存在 的 部 分 光谱 特征 、 雷 达 信 
息 丢 失 和 失真 等 问题 ,还 有 待 继 续 研 究 。 余 祥 伟 等 ” 
利用 乘积 变换 .G-S 变换 .PC 变换 ,小波 变换 等 算法 
将 星 载 SAR FI Landsat 8 OLI 进 行 融 合 ,发现 G-S 变 
换 和 PC 变换 能 够 较 好 实现 星 载 SAR 和 光学 影像 的 
融合 ,但 仍然 存在 信息 量 .空间 分 辨 率 增加 的 同时 ， 


光谱 特征 丢失 的 问题 。 姜 红 等 研究 发 现 , 以 雷达 
后 向 散射 系数 和 改进 型 温度 植被 干旱 指数 共同 作 
为 SVM 模 型 输入 参数 时 ,土壤 水 分 监测 精度 显著 提 
高 。 因 此 ,本 文 组 合 VIP 筛选 得 到 的 光谱 指数 和 雷 
达 极 化 组 合 指数 共同 参与 建 模 , 充 分 结合 光学 遥感 
和 微波 遥感 优势 , 较 好 地 保留 了 土壤 的 光谱 特征 和 
雷达 信息 。 

最 优 变 量 筛选 方法 结合 最 优 机 器 学 习 算 法 可 
以 有 效 提高 反 演 精 度 。 本 文 比较 VIP 和 GC sina HE 
量 优 劣 ,发 现 VIP 的 结果 更 为 可 靠 ,与 王 海 峰 等 2 的 
研究 结果 相同 。 这 是 因为 VIP 通过 判断 特征 对 模型 
准确 率 的 影响 和 加 入 噪声 干扰 前 后 模型 准确 率 的 
变换 来 实现 对 模型 精度 的 优化 构建 ,但 李 明 亮 * 指 
出 GC 筛选 变量 建 模 同样 能 够 有 效 提高 模型 拟 合 精 
度 。 有 人 研究 ”指出 ,土壤 成 分 对 反 演 模 型 的 性 能 
很 大 的 影响 ,因此 本 文 所 选 变量 筛选 方法 是 否 适 用 
于 其 他 研究 区 有 竺 商 椎 。 本 文选 择 BPNN SVM 和 
RF 3 种 传统 机 需 学 习 算 法 反 演 土壤 盐分 ,发 现 
BPNN 和 SVM 精度 较 低 ,RF 精度 最 高 ,能够 满足 研 
究 区 土壤 含 盐 量 的 反 演 ,这 与 张 智 辆 等 ”所 得 结论 
基本 一 致 。 可 见 , 将 RF 应 用 于 土壤 含 盐 量 反 演 ,能 
够 在 一 定 程度 上 提升 模型 反 演 精 度 。 而 近年 来 , 诸 
多 学 者 尝试 引入 网 格 搜 索 随机 搜索 和 贝 叶 斯 等 算 


法 对 机 器 学 习 进 行 超 参 数 优化 ,Chen 等 所 提出 了 一 
种 基于 树 结 构 Parzen 估计 器 (CTPE ) 优 化 算法 的 极端 
梯度 提升 (XGBoost) 模 型 ,结果 表明 TPE 联合 优化 
算法 显著 提高 了 XGBoost 模 型 的 性 能 ,具有 和 较 强 的 
泛 化 能 力 。Wang 等 同样 在 贝 叶 斯 优化 框架 下 ,将 
超 参数 和 特征 选择 相 结合 ,对 光 梯 度 增强 机 (Light- 
GBM) 模 型 进行 自 适应 联合 优化 。Xu 等 “提出 了 一 
种 自 适 应 遗传 算法 (AGA) 的 支持 向 量 机 输入 特征 
和 超 参数 同时 识别 的 新 方法 ,并 使 用 网 格 搜 索 优 化 
超 参 数 。 这 些 优化 算法 的 引入 表明 学 者 们 开始 关 
注 特征 选择 和 超 参 数 调整 对 机 器 学 习 模 型 性 能 的 
影响 ,以 及 输入 特征 和 超 参 数 之 间 的 复杂 依赖 性 和 
相互 作用 ,进而 从 模型 层面 提高 预测 精度 。 因 此 ， 
之 后 的 研究 可 以 考虑 引入 不 同 优化 算法 ,并 结合 特 
征 变量 筛选 方法 ,以 期 进一步 提高 模型 的 反 演 精度 
和 普 适 性 。 

本 文选 择 光 谱 指 数 和 雷达 极 化 组 合 指 数 协 同 
VIP-RF 模 型 反 演 研究 区 耕地 土壤 含 盐 量 ,结果 表 
明 ,研究 区 耕地 盐 渍 化 已 较为 严重 , 盐 渍 化 土壤 占 
耕地 总 面积 的 86.81% ,中 度 盐 渍 化 土壤 分 布 范围 最 
广 , 达 到 了 耕地 总 面积 的 33.54%, 这 与 前 人 研究 “ 
所 得 结论 相符 。 平 罗 县 地 处 内 陆 干旱 区 ,气候 干 
燥 , 土 壤 透 气 .透水 性 差 , 易 产生 盐 渍 化 。 中 西部 为 
山 前 洪 积 扇 区 和 西 大 滩 碟 形 洼地 ,排水 条 件 差 。 东 
部 引 黄 灌溉 区 灌溉 方式 不 合理 ,党 出 现 过 量 引 水 和 
引 黄河 大 水 漫灌 现象 ,灌溉 水 的 渗 漏 引起 地 下 水 位 
升 高 和 强烈 莹 发 ,造成 盐 渍 化 愈演愈烈 ,进而 严重 
影响 农业 生产 。 因 此 ,利用 遥感 监测 ,结合 盐 渍 土 
改良 与 治理 的 主要 机 制 ,如 物理 调控 化 学 调理 HE 
排 管理 和 生物 改良 扣 ,因地制宜 ,提出 可 行 性 的 治 
理 措施 ,以 减少 盐 涡 化 给 当地 农业 发 展 和 自然 环境 
造成 的 危害 。 

本 文 土壤 样本 采样 与 影像 获取 时 间 不 一 致 , 而 
土壤 含 盐 量 存在 短期 变化 情况 ,影像 数据 难以 真实 
反应 地 表情 况 ,数据 存在 不 确定 性 。 后 续 研 究 可 以 
考虑 利用 无 人 机 技术 ,在 同一 时 间 段 采集 土壤 样本 
和 遥感 数据 , 且 无 人 机 数据 分 辩 率 高 达 厘 米 级 , 模 
型 反 演 精度 会 更 高 。 


4 结论 


本 文采 用 VIP 和 GCC 筛选 特征 变量 ,利用 光谱 指 
数 .雷达 极 化 组 合 指数 .光谱 和 雷达 指数 组 合 的 3 种 
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不 同 数据 源 构建 基于 不 同 机 器 学 习 算法 的 土壤 盐 
分 反 演 模型 ,得 到 以 下 结论 : 

(1) 基于 GC 方法 确定 的 光谱 指数 和 雷达 极 化 
组 合 指数 数量 差异 较 大 ,筛选 变量 所 构建 的 模型 反 
演 效果 较 差 ;基于 VIP 方法 确定 的 光谱 指数 和 雷达 
极 化 组 合 指数 数量 相同 ,筛选 变量 所 构建 的 模型 精 
度 相 对 较 高 。 

(2) REF 模型 反 演 效果 最 优 ,SVM 次 之 ,BPNN 效 
果 最 差 ,说 明 RF 较 其 他 2 种 机 器 学 习 算 法 更 适 于 该 
研究 区 耕地 土壤 含 盐 量 反 演 。 

(3) 组 合 多 源 遥 感 数据 构建 的 VIP-RF 模 型 验 
证 集 尼 =0.780, 较 单一 光谱 指数 模型 和 雷达 极 化 组 
合 指数 模型 分 别提 高 0.091 和 0.237 ,说明 组 合 多 源 
遥感 数据 能 够 有 效 提 高 土壤 含 盐 量 反 演 精度 ,有 助 
于 更 加 精确 地 研究 区 域 土 壤 盐分 分 布 情况 ,提升 土 
培 盐 渍 化 监测 水 平 。 

(4) 根据 反 演 结果 可 知 , 平 罗 县 耕地 盐 渍 化 较为 
严重 , 非 盐 渍 化 土壤 仅 占 耕地 总 面积 的 13.19% , 轻 度 
盐 涡 化 和 中 度 盐 渍 化 土壤 较 多 , 占 比 分 别 为 23.77% 
和 33.54% ,29.5% 的 耕地 恶化 为 重度 盐 涡 化 和 盐 士 。 
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Abstract: The safeguarding of cultivated land is paramount in ensuring national food security, sustainable eco- 
nomic and social development, and the preservation of the ecological environment. Rapid and accurate acquisi- 
tion of cultivated soil salinity and spatial distribution information is imperative for the protection of cultivated 
land. This study focuses on cultivated land in Pingluo County, Ningxia, China, as the research object and discuss- 
es the feasibility of combining optical remote sensing and microwave remote sensing to predict the accuracy of 
soil salt content compared with single remote sensing data. The methodology involved the extraction of the spec- 
tral indices from Landsat 9 OLI and radar polarization combination indices from Sentinel-1. Variable projection 
importance and gray correlation degree were used to screen and combine characteristic variables. Three machine 
learning algorithms (back propagation neural network, support vector machine, and random forest) were used to 
construct the soil salt content prediction model. The best model was used to predict the spatial distribution of the 
soil salt content in cultivated land. The results show the following facts: (1) The model, validated using the vari- 
able projection importance method for screening variables, generally exhibited a higher determination coefficient 
(R°) than the model established using the gray correlation method for characteristic variables. (2) Using the ran- 
dom forest algorithm, the model combining the spectral index and radar polarization combination index demon- 
strated the best effect. The modeling set exhibited an R of 0.791 and a root mean square error (RMSE) of 1.016. 
This represented an increase in R* by 0.065 and 0.085 compared with the single data source model, with corre- 
sponding decreases in RMSE by 0.147 and 0.189. The validation set showed an R of 0.780 and an RMSE of 
1.132, indicating a respective increase in R’ by 0.091 and 0.237 and a decrease in RMSE by 0.175 and 0.377 com- 
pared with the single data source model. (3) The distribution range of mildly salinized and moderately salinized 
soil of cultivated land in Pingluo County covered wide areas, accounting for 23.77% and 33.54%, respectively, 
whereas severely salinized soil constituted 15.37%. This underscores the effectiveness of modeling by combining 
multisource remote sensing data in improving the prediction accuracy of soil salt content. The outcomes offer a 
valuable technical reference for predicting soil salt content in arid areas and contribute to the sustainable develop- 
ment of local agriculture. 

Key words: optical and microwave remote sensing; machine learning; cultivated land; inversion of soil salt con- 
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